Математические методы распознавания
С целью обеспечения высокой эффективности сложных, больших систем распознавания наряду с теоретическими исследованиями применяют математическое или (и) физико-математическое моделирование. Например, при построении локационных систем селекции и распознавания разрабатывается комплекс математических моделей, являющийся инструментом для организации исследований на основе выполнения математических экспериментов [7]. Физико-математическое моделирование предусматривает сочетание физических (лабораторных, натурных) и математических экспериментов. При этом, как отмечено в [7], роль математического эксперимента значительнее при лабораторных исследованиях, чем при натурных испытаниях. При разработке большой системы распознавания и ее элементов может реализовываться следующая цепочка: физико-математические исследования – натурные испытания.
Решение задач, возникающих при разработке и эксплуатации распознающих систем, осуществляется с применением математики. Так, для обработки априорной информации логического характера применяется алгебра логики стохастического характера – теория вероятностей, математическая статистика, теория матриц, теория множеств и т. д. А при разработке системы распознавания применяются также методы исследования операций, теории игр, теории принятия решений и др.
В работе [3] проблема распознавания, заключающаяся в нахождении рабочего алфавита классов, рабочего словаря признаков, описания классов на языке признаков, оптимального состава комплекса технических средств системы распознавания, которые при наилучшем решающем правиле обеспечивают наиболее эффективное решение задачи распознавания, в условиях наличия ограничений на используемые ресурсы для создания комплекса технических средств, сформулирована в виде оптимизационной задачи и приведен метод ее решения, основанный на математическом моделировании.
В работе [1] рассматриваются следующие методы анализа данных:
• дискриминантный анализ – для построения разделяющих функций в признаковом пространстве;
• выделение и выбор признаков –для сужения избыточного множества признаков до подмножества «наилучших признаков» или их комбинаций;
• кластерный анализ – для разделения данных на подобные группы объектов.
В дискриминантном анализе формирование разделяющих функций основывается на одном из статистических или эвристических методов. Статистические методы нацелены на минимизацию ошибки классификации, представляющей собой вероятность неправильной классификации поступившего на распознавание k-мерного объекта X. К таким методам относят [1]:
• разделение с помощью квадратичной функции на основе использования плотностей нормального распределения;
• разделение с помощью линейных функций на основе использования плотностей нормального распределения;
• непараметрические методы, применяемые в случае отсутствия информации о виде кривой плотности распределения;
• применение адаптивных разделяющих функций, позволяющих внесение изменений в значения их параметров при неправильной классификации.
Эвристические методы ориентированы на критерии, непосредственно связанные с имеющимися исходными данными. К этим методам относят [1]:
• правило ближайшего соседа, в соответствии с которым, исследуемый объект относят к тому классу, к которому принадлежит его ближайший сосед из обучающей выборки;
• правило К ближайших соседей;
• оптимизация по какому-либо критерию ошибки выбранной разделяющей функции (линейной, квадратичной и т. д.), например, число неправильно классифицированных объектов из обучающей выборки, расстояние (среднее или «взвешенное») между обучающей выборкой и разделяющей функцией;
• иерархическое разделение на основе применения дерева решений, в каждой вершине которого исследуется один из многих признаков, в зависимости от значения которого выбирается очередная ветвь. В нижней вершине принимается классификационное решение.
Выделение и выбор признаков может обуславливаться следующим: необходимостью нахождения совокупности признаков, порождающих только различие между классами; ограничением на время выполнения вычислительных процедур; ограниченными ресурсами на приобретение и создание технических средств системы распознавания и др. Для реализации этой цели применяется ряд критериев адекватности набора признаков. Например, критерий Фишера как одномерный критерий адекватности каждого признака для разделения двух классов, расстояние Махаланобиса как многомерный критерий для разделения различных классов, оценка совокупности признаков при полном или частичном переборе выбираемого подмножества признаков из исходного избыточного множества признаков и др.
Кластерный анализ служит инструментом для выделения структур, классов, множеств подобных объектов из исходных неклассифицированных совокупностей. Ввиду многоаспектного характера применения кластерного анализа (социология, психология, биология, медицина, геология, астрономия и др.) в нем применяются разнообразные критерии, определяемые конкретными целями анализа в различных прикладных задачах. В литературе описано множество методов кластеризации, основанных на творческом подходе к использованию приемов кластерного анализа для создания «своего» метода кластеризации. Основы кластерного анализа изложены в работе [5].
Рассмотрим некоторые разновидности кластерного анализа. Одной из разновидностей методов кластерного анализа являются методы, основанные на отыскании моды распределения. В них полагается связь между кластерами и максимумами плотности распределения данных. Оценивая плотности распределения одним из известных методов и находя максимумы (моды) их соотносят с некоторыми кластерами. При необходимости возможно объединение ряда кластеров с целью реализации принадлежности исследуемого элемента среды к одному из кластеров.
При априорно известном числе кластеров возможно применение метода кластерного анализа критерием в котором является отношение внутрикластерной дисперсии к межкластерной дисперсии. В этом случае возможно также применение итеративного самоорганизующегося метода анализа данных, основанного на идее принадлежности объектов к кластеру с наиболее близким средним значением. Вначале, на первом шаге, случайным образом выбирают средние значения для исходного разбиения «сгустков» объектов. Затем, на втором шаге, осуществляют отнесение объектов к тем кластерам, центры которых находятся от них на наименьшем расстоянии. Рассчитываются новые средние значения для кластеров и циклически повторяют второй шаг до завершения процесса кластеризации.
Следующей разновидностью методов кластерного анализа являются иерархические схемы кластеризации. Вначале каждый объект рассматривается как отдельный кластер. Затем, пошагово осуществляют объединение исходных кластеров на основе установленных способов измерения расстояния между кластерами до тех пор, пока не будет получена искомая совокупность кластеров. При этом возможно применение интерактивного режима.
В распознавании объектов, явлений, ситуаций и т. д. возможно применение идей теории нечетких множеств, в которых принадлежность элементов к таким множествам может принимать любые значения в диапазоне 0–1. Нечеткие множества можно применять в условиях неопределенности для квантифицирования и формализации различных неопределенных и интуитивных утверждений типа «теплый день», когда установлено всего лишь два класса дней: «жаркий день» и «холодный день». Тогда «теплый день» может принадлежать классу «жаркий день», например, со значением принадлежности 0,6 и к классу «холодный день» со значением принадлежности 0,15. Сумма указанных двух значений может быть отличной от единицы. В теории нечетких множеств вводятся понятия объединения и пересечения множеств. Например, принадлежность к объединению нечетких множеств А и В элемента ), имеющего значение принадлежности к множеству и к множеству , можно определить как:
Похожие рефераты: